Python爬虫开发工程师

广东优计划科技有限公司

0.9-1.5 W

南沙

本科 1年经验
Python爬虫开发工程师

0.9-1.5 K

职位描述:

岗位职责:

岗位职责:
1、负责设计和开发分布式的网络爬虫应用,包括调度、抓取、入库等内容,进行互联网相关信息的抓取和分析。
2、实现大规模文本、图像数据的抓取、抽取,去重、分类,垃圾过滤,质量识别、解析入库等工作 。
3、网络爬虫架构设计、功能开发及优化。
4、网页信息抽取等核心算法的研究和优化。负责公司运营平台开发工作。
5、参与项目整体规划设计过程,制定项目迭代计划。
6、负责解决项目相关的开发需求以及Bug修正,相关的问题的沟通协调工作。
 
岗位要求:
1、计算机相关专业,具备1年及以上开发项目经验;最好有广告行业、Web应用系统开发行业经验。
2、掌握网络爬虫开发原理,对互联网各种类型数据交互模式熟悉,知道如何处理需登录网站、动态网页等各种情况下的数据采集方法。
3、精通html语言,熟悉开源工具,熟悉基于正则表达式、XPath等的信息抽取技术。
4、有网络爬虫开发经验、有scrapy等开源抓取工具开发经验优先。
5、熟悉至少一种关系型数据库(Mysql等),熟悉Nosql,hbase等技术优先。
6、逻辑思维清晰,做事有条理,具备较好的数据分析能力和解决问题的能力。
7、工作积极主动、严谨负责。学习能力强,有一定的技术狂热,愿意学习和接受新知识和技术,有一定的英语阅读能力,会用GOOGLE,STACKOVERFLOW搜索问题,对全栈工程师的概念有了解。

职能类别: 数据库工程师/管理员 系统架构设计师

关键字: python 爬虫

企业介绍:

优计划基于互联网、云计算新型技术专注为新客运、新旅游、新零售、新制造提供软硬件技术解决方案,逐步结合大数据、物联网、人工智能技术,成倍提升行业体验、运营效率。 公司第一阶段定位专注行业软件研发,通过开发行业各种专业服务组件,向行业企业提供自助式公司简介: 优计划基于互联网、云计算新型技术专注为新客运、新旅游、新零售、新制造提供软硬件技术解决方案,逐步结合大数据、物联网、人工智能技术,成倍提升行业体验、运营效率。 公司第一阶段定位专注行业软件研发,通过开发行业各种专业服务组件,向行业企业提供自助式软件服务。公司发展前期以软件研发为基础,中期通过整合大数据助力改善行业供给侧结构,后期开拓新的商业模式。目前致力于为班车客运企业、零售企业提供软件服务,帮助企业打造生态级的“互联网+”商业平台,从线下到线上,从直营到分销,从行内到行外,让更多企业拥抱互联网
  • 公司规模:50-99人人
  • 公司地址:广州市天河区元岗横路37号惠通产业园b区b4212
  • 注册时间:2006-05
  • 注册资本:1000万
  • 经营范围:2016年10月17日-无固定期限 经营范围:计算机技术开发、技术服务;软件开发;信息系统集成服务;计算机房维护服务;信息技术咨询服务;数据处理和存储服务;地理信息加工处理;行李包裹寄存服务;汽车租赁;计算机及通讯设备租赁;交通运输咨询服务;软件服务;向游客提供旅游、交通、住宿、餐饮等代理服务(不涉及旅行社业务);票务服务;安全智能卡类设备和系统制造;通信终端设备制造;交通安全、管制及类似专用设备制造;企业管理咨询服务;企业形象策划服务;策划创意服务;市场调...